对应匹配是计算机视觉和机器人技术应用中的一个基本问题。最近使用神经网络解决对应匹配问题最近正在上升。旋转等级和比例等级性在对应匹配应用中都至关重要。经典的对应匹配方法旨在承受缩放和旋转转换。但是,使用卷积神经网络(CNN)提取的功能仅在一定程度上是翻译等值的。最近,研究人员一直在努力改善基于群体理论的CNN的旋转均衡性。 SIM(2)是2D平面中的相似性转换组。本文介绍了专门用于评估SIM(2) - 等级对应算法的专门数据集。我们比较了16个最先进(SOTA)对应匹配方法的性能。实验结果表明,在各种SIM(2)转换条件下,组模棱两可算法对于对应匹配的重要性。由于基于CNN的对应匹配方法达到的子像素精度不令人满意,因此该特定领域需要在未来的工作中获得更多关注。我们的数据集可公开可用:mias.group/sim2e。
translated by 谷歌翻译
最近,基于CNN的RGB-D显着对象检测(SOD)在检测准确性方面取得了显着提高。但是,现有模型通常在效率和准确性方面表现良好。这阻碍了他们在移动设备以及许多实际问题上的潜在应用。在本文中,为了弥合RGB-D SOD的轻质和大型模型之间的准确性差距,一个有效的模块可以极大地提高准确性,但提出了很少的计算。受深度质量是影响准确性的关键因素的启发,我们提出了有效的深度质量启发的功能操纵(DQFM)过程,该过程可以根据深度质量动态滤波深度特征。提出的DQFM求助于低级RGB和深度特征的对齐,以及深度流的整体注意力,以明确控制和增强交叉模式融合。我们嵌入了DQFM,以获得一个称为DFM-NET的有效的轻质RGB-D SOD模型,此外,我们还设计了一个定制的深度骨架和两阶段解码器作为基本零件。 9个RGB-D数据集的广泛实验结果表明,我们的DFM-NET优于最近的有效型号,在CPU上以约20 fps的速度运行,仅8.5mb型号大小,同时快2.9/2.4倍,比6.7/3.1倍,小于6.7/3.1倍最新的最佳型号A2DELE和手机。与非效率模型相比,它还保持最先进的准确性。有趣的是,进一步的统计数据和分析验证了DQFM在没有任何质量标签的各种品质的深度图中的能力。最后但并非最不重要的一点是,我们进一步应用DFM-NET来处理视频SOD(VSOD),与最近的有效模型相比,相当的性能,而比该领域的先前最佳状态的速度/2.3倍/小2.3倍。我们的代码可在https://github.com/zwbx/dfm-net上找到。
translated by 谷歌翻译
无人机(UAV)跟踪在农业,导航和公共安全等中具有广泛的潜在应用。但是,计算资源,电池容量和无人机的最大负载的局限性阻碍了无人机上基于深度学习的跟踪算法的部署。因此,由于其高效率,歧视性相关过滤器(DCF)跟踪器在无人机跟踪社区中脱颖而出。但是,它们的精度通常比基于深度学习的跟踪器要低得多。模型压缩是一种有希望的方法,可以缩小基于DCF和深度学习的跟踪器之间差距(即效率,精度),这并没有引起无人机跟踪中的很多关注。在本文中,我们提出了P-SIAMFC ++跟踪器,该跟踪器是第一个使用基于等级的过滤器修剪来压缩SIAMFC ++模型的方法,在效率和精度之间取得了显着的平衡。我们的方法是一般的,可能会鼓励通过模型压缩对无人机跟踪的进一步研究。在四个无人机基准测试中进行的广泛实验,包括UAV123@10FPS,DTB70,UAVDT和Vistrone2018,表明P-SiAMFC ++跟踪器显着胜过最先进的无人机跟踪方法。
translated by 谷歌翻译
深度可以为显着对象检测(SOD)提供有用的地理线索,并已证明对最近的RGB-D SOD方法有所帮助。但是,现有的视频显着对象检测(VSOD)方法仅利用时空信息,很少利用深度信息进行检测。在本文中,我们提出了一个深度合并的三峰网络,称为VSOD的DCTNet,这是一项开创性的工作,旨在合并深度信息以帮助VSOD。为此,我们首先从RGB框架中生成深度,然后提出一种方法来不平等地处理这三种方式。具体而言,多模式注意模块(MAM)设计为对主模态(RGB)和两个辅助模态(深度,光流)之间的多模式远程依赖性建模。我们还引入了一个细化融合模块(RFM),以抑制每种模式中的噪音,并动态选择有用的信息以进行进一步的优化。最后,在精制特征以实现最终的跨模式融合后采用了渐进式融合策略。五个基准数据集的实验证明了我们的深度合并模型与12种最先进方法的优越性,并且还验证了深度的必要性。
translated by 谷歌翻译
随着环境感知等关键技术的发展,自动车辆的自动化水平一直在增加。然而,在达到高度自主驾驶之前,手动驾驶仍然需要参与驱动过程以确保人车辆的安全性。现有的人工合作社驾驶侧重于汽车工程和司机的行为,在视野中少数研究研究。由于复杂道路交通冲突情景的表现不佳,需要进一步研究合作视觉感知。此外,自主驾驶感知系统无法正确理解手动驾驶的特性。基于上面的背景,本文直接提出了一种基于转移学习方法和复杂道路交通场景的传输学习方法和图像融合算法来增强共享自主驱动的视觉感知能力的人工载体的协作视觉传感方法。基于转移学习,物体检测地图达到75.52%,为视觉融合奠定了坚实的基础。融合实验进一步揭示了人工车辆的合作视觉感知反映了最风险的区域并更准确地预测冲突物体的轨迹。本研究开创了在现实世界复杂的交通冲突方案中共享自主驾驶和实验的合作视觉认知解决方案,可以更好地支持以下规划和控制和提高自动车辆的安全性。
translated by 谷歌翻译
我们提出DIY-IPS - 自己动手 - 室内定位系统,这是一个开源实时室内定位移动应用程序。DIY-IPS通过使用可用WiFi接入点的双波段RSSI指纹识别来检测用户的室内位置。该应用程序可以无需额外的基础设施费用即可实时检测用户的室内位置。我们发布了我们的应用程序作为开源,以节省其他研究人员的时间来重新创建它。该应用程序使研究人员/用户能够(1)使用地面真相标签收集室内定位数据集,(2)以更高的准确性或其他研究目的自定义应用程序(3)通过用地面真相实时测试测试修改方法的准确性。我们进行了初步实验,以证明应用程序的有效性。
translated by 谷歌翻译
“搜索”或“导航到”?当找到一个物体时,这两个选择总是在我们的潜意识中出现。在看到目标之前,我们根据经验搜索目标。看到目标后,我们记住目标位置并导航到。但是,最近在对象导航字段中的方法几乎仅考虑使用对象关联来增强“搜索”阶段,同时忽略了“导航到”阶段的重要性。因此,本文提出了双重自适应思维(DAT)方法,以灵活调整不同导航阶段的不同思维策略。双重思考包括具有目标位置能力的对象关联能力和导航思维的搜索思维。为了使导航思维更有效,我们设计了面向目标的内存图(TOMG)来存储历史目标信息和目标感知的多规模聚合器(TAMSA)以编码相对目标位置。我们在AI2-数据集上评估我们的方法。与最先进的方法(SOTA)方法相比,我们的方法报告成功率10.8%,21.5%和15.7%(SR),成功按路径长度(SPL)加权(SPL)和成功通过导航效率加权(SNE) ), 分别。
translated by 谷歌翻译
分散的参与者 - 批评(AC)算法已被广泛用于多机构增强学习(MARL),并取得了杰出的成功。除了其经验成功之外,分散的AC算法的理论收敛性在很大程度上没有探索。现有的有限时间收敛结果是基于双环更新或两次尺度的步骤规则得出的,这在实际实施中不经常采用。在这项工作中,我们介绍了一种完全分散的AC算法,演员,评论家和全球奖励估算器以交替的方式更新,阶跃尺寸的顺序相同,即,我们采用\ emph {single-emph {single-timesscale}更新。从理论上讲,使用线性近似进行价值和奖励估计,我们表明我们的算法具有$ \ tilde {\ Mathcal {o}}}(\ epsilon^{ - 2})$的样本复杂性,在马尔可夫式采样下与最佳复杂性相匹配双环实现(在此,$ \ tilde {\ Mathcal {o}} $隐藏了日志项)。样本复杂性可以提高到$ {\ Mathcal {o}}(\ epsilon^{ - 2})$下的I.I.D.采样方案。建立我们的复杂性结果的核心是\ emph {我们揭示的最佳评论家变量的隐藏平滑度}。我们还提供了算法及其分析的本地动作隐私版本。最后,我们进行实验,以显示我们算法优于现有的分散AC算法的优势。
translated by 谷歌翻译
对象导航任务要求代理根据视觉信息在未知环境中找到特定对象。以前,图形卷积被用于隐式探索对象之间的关系。但是,由于对象之间可见性的差异,很容易在对象注意中产生偏见。因此,在本文中,我们提出了一个定向的对象注意(DOA)图,以指导代理显式地学习对象之间的注意力关系,从而减少对象的注意偏置。特别是,我们使用DOA图在原始图像上分别对对象特征和无偏的自适应图像注意(UAIA)进行无偏的自适应对象注意(UAOA)。为了区分不同分支的特征,提出了一种简洁的自适应分支分布(ABED)方法。我们在AI2-数据集上评估我们的方法。与最先进的方法(SOTA)方法相比,我们的方法报告了7.4%,8.1%和17.6%的成功率(SR),成功按路径长度(SPL)加权(SPL)并通过动作效率加权成功(SAE) ), 分别。
translated by 谷歌翻译
这项工作适用于最低贝叶斯风险(MBR)解码,以优化翻译质量的各种自动化指标。机器翻译中的自动指标最近取得了巨大的进步。特别是,在人类评级(例如BLEurt,或Comet)上微调,在与人类判断的相关性方面是优于表面度量的微调。我们的实验表明,神经翻译模型与神经基于基于神经参考度量,BLEURT的组合导致自动和人类评估的显着改善。通过与经典光束搜索输出不同的翻译获得该改进:这些翻译的可能性较低,并且较少受到Bleu等表面度量的青睐。
translated by 谷歌翻译